Определение золотого стандарта: Среднеквадратичная ошибка (MSE)
Чтобы измерить, насколько наша гипотеза $T$ отклоняется от реальности $\psi(\theta)$, мы определяем среднеквадратичную ошибку (определение 6.3.1):
$$MSE_\theta(T) = E_\theta((T - \psi(\theta))^2)$$
Это среднее квадратическое отклонение между нашей оценкой и целью. Идеальный оценщик имел бы нулевую MSE, но в мире случайных помех мы стремимся её минимизировать.
Теорема 8.1.1: Архитектура ошибки
Почему оценщик может быть неудачным? Теорема 8.1.1 даёт чертёж. Если у $T$ конечный второй момент, то ошибка относительно любого постоянного значения $c$ задаётся формулой:
Эта формула показывает, что общая квадратическая ошибка минимизируется только когда мы выбираем $c = E(T)$. В контексте вывода мы полагаем $c = \psi(\theta)$, что приводит к знаменитому разложению:
MSE = Дисперсия + Смещение²
Торговля точностью и точностью
Представьте два веса в лаборатории контроля качества:
- Точный древний артефакт: Он даёт одинаковый вес каждый раз (низкая дисперсия), но смещён на 2 грамма (высокое смещение).
- Непостоянный мудрец: Он прав в среднем (нулевое смещение), но сильно колеблется между измерениями (высокая дисперсия).
Теорема 8.1.1 позволяет точно вычислить, какой из весов даёт меньшую общую ошибку. Часто мы готовы принять небольшое систематическое отклонение (смещение), если оно значительно уменьшает шум (дисперсию).
Пример 8.1.1: Достаточность и информация
Оптимальность связана с информацией. Рассмотрим пространство выборки $S = \{1, 2, 3, 4\}$. Если исходы 2, 3 и 4 равновероятны при любом возможном параметре, они несут одинаковую вероятность. Мы можем определить достаточную статистику $U$, которая объединяет эти исходы без потери способности делать оптимальный вывод. Как показано в симуляции, если $L(\cdot|2) = L(\cdot|3) = L(\cdot|4)$, оптимальная оценка рассматривает их как одно информативное событие.